生成式AI强势崛起 中国大模型企业凭何致胜未来?
导语:在国内所有的生成式A势崛AI技术服务商当中,商汤可以算是强起中企业最特殊的一个。
8月27日,模型天门市某某生物科技有限责任公司港股上市的凭何AI科技公司商汤科技(00020.HK),发布了2024年中期业绩公告。致胜
财报显示,生成式A势崛2024年上半年,强起中企业公司总体收入为17.4亿元,模型同比增长21.4%,凭何三大业务当中,致胜来自生成式AI的生成式A势崛收入为10.5亿元,同比大幅增长255.7%,强起中企业收入贡献占比达到60.4%,模型成为商汤的凭何第一大收入来源。在生成式AI业务的致胜强势带动下,上半年集团整体毛利达到7.7亿元,同比增长18.2%。
生成式AI的强势崛起,成为商汤新的收入支柱和增长来源。
放眼全球,AI行业仍处于投入远大于产出的早期发展阶段, 如何利用AI技术赋能传统商业模式,实现可持续的商业营收,是摆在整个行业乃至AI科技革命面前的共同挑战。
在所有人都在努力寻找答案的背景下,为什么商汤可以凭借生成式AI获得显著的营收增长?这是个值得思考的问题。
01 商汤靠什么?
今年以来,随着大洋彼岸英伟达(NVDA.US)股价和业绩的狂飙突进,许多人惊讶的发现,来自于生成式AI领域的算力和服务需求,正在以令人瞠目结舌的速度迅速增长。
而在中国市场,这样的需求同样在以惊人的速度爆发。IDC报告预测,未来五年,天门市某某生物科技有限责任公司中国AIDC服务市场以高增速持续增长,预计年均复合增长率达57.3%,2028年整体市场规模近2000亿人民币,其中训练侧算力需求将增长10倍以上,而推理侧算力需求更将增长200倍以上。
那么,商汤科技财报中所说的“生成式AI业务”,具体包含了哪些业务呢?
想要回答这个问题,我们需要回到业务基本面当中寻找答案。
首先,毋庸置疑,商汤是AIGC领域重要玩家之一,旗下的日日新大模型是国内综合性能比较先进的大模型产品之一。
作为大模型服务商,商汤为诸多客户提供了大模型能力调用的支持,因此,这部分业务所产生的收入,自然成为了商汤生成式AI营收的组成部分之一。
但对于商汤的业务版图来说,对外提供大模型能力调用服务,这仅仅只是生成式AI营收构成中的一部分。而另一个核心组成部分,则是SenseCore商汤AI大装置。
什么是商汤AI大装置?
简而言之,商汤AI大装置,是商汤自己使用同时也提供给第三方客户的、用来训练AI大模型的一整套基础设施,这其中包含了硬件和基础设施如GPU和AIDC等,也包含了诸多由商汤自行研发的软件及算法。
实际上,整个商汤AI大装置SenseCore包含了三层结构:算力层,包含AI芯片及处理卡,以及安置这些硬件的AIDC相关设施;平台层,包含大模型的训练和数据管理所需要的诸多支持软件及后台程序;算法层,则是商汤提供给客户使用的算法工具箱以及辅助开发的框架。
无论是AI算力的硬件,还是平台和算法层面的各类工具和框架的使用,这些资源整合到一起,成为可以让客户随意使用的统一的大模型业务平台,让客户可以在最短的时间、用最低的成本去训练属于自己的大模型,这就是商汤AI大装置的存在价值所在,也是商汤可以在生成式AI市场获得差异化竞争力的基础。
02 AI组合拳:大模型+大装置
在商汤的管理团队看来,公司最大的竞争优势,来自于大模型加大装置的有机协同。
商汤集团董事会执行主席兼首席执行官徐立博士表示:“生成式AI迎来黄金发展时期,我们正处于下一波增长的有利位置。商汤核心优势在于‘大装置+大模型’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互、以及低成本模型推理架构上构建独特的优势,从而在激烈的市场竞争中脱颖而出。”
作为“大模型+大装置”协同战略的组成部分,商汤对于AI大装置SenseCore的研发由来已久——实际上,早在2018年,商汤就启动了大装置的相关建设。
在AIDC的建设方面,商汤建设并运营的上海临港AIDC是亚洲最大的人工智能算力中心,2024年上半年,商汤运营的总算力高达20000PetaFLOPS,GPU规模超过5.4万张,稳居行业领导地位,能够支持高达2万亿参数的MoE多模态模型的稳定高效训练和推理。
在平台的升级和优化方面,在推理场景中,商汤创新的技术架构能够实现在相同算力及电力成本下的每秒请求数(QPS)提升4倍,并支持推理服务弹性按需伸缩,进一步优化了大规模AI推理的整体成本。此外,基于原创的训推一体、算电协同等技术创新,商汤持续提高万卡集群的GPU资源利用率至最高80%以上,大幅度提升AIDC的整体运营回报率。
而作为“大模型+大装置”协同战略的另一极,在大模型的迭代和发展上,商汤同样快马加鞭。
今年上半年,商汤的“日日新”大模型迭代至5.5版本,综合能力显著提升,在多模态和实时交互体验方面实现了对标GPT-4o的性能,为AI应用层的开发提供了最好的大模型基础底座。
据财报显示,上半年,商汤日日新大模型的整体调用量实现了400%的增长,用户数和平均调用量均大幅度提升;客户亦遍布互联网、智能硬件、电动汽车、机器人、医疗、金融等多个行业。
商汤的大模型和大装置,正在业务层面形成越来越紧密的合力:大装置作为大模型的底层算力基础,为日日新大模型的快速升级迭代提供了最基本的保障;而从大装置上迭代发展起来的大模型,则给不同行业、不同需求的客户提供了灵活的能力调用和需求满足,让行业客户不需要一切从零开始,而是借助日日新大模型成熟的能力,快速的实现自己的业务需求,大大降低了通过AI进行商业流程再造的时间和资源成本。
大模型+大装置的业务组合,最大限度的满足了不同预算、不同规模、不同行业的客户的实际需求,整个上半年,超过三千家客户使用商汤的AIDC及日日新大模型业务。
03 技术赋能行业 AI创造价值
在生成式AI领域,商汤的客户既包括了京东、小米、金山等互联网公司,也包括了像三大电信运营商、吉利、OPPO等行业领军企业,甚至还不乏大模型创业公司之类的同行。
对于那些实力雄厚的大公司、大机构,为什么愿意选择商汤作为自己进入AI领域的首要合作伙伴?商汤的大模型和大装置,究竟能给这些客户带来什么?
可以通过两个不同行业的案例,一窥其中答案。
案例一:PathOrchestra病理大模型
在医疗行业,病理诊断被誉为疾病诊断的“金标准”,但长期以来,这个领域一直面临着病理医生培养周期长、优质病理诊断资源分布不均匀的问题。即使对于国内三甲医院而言,优秀的病理医生都是十分稀缺的人才。
近年来,人工智能技术的应用,让国内外病理科迎来数智化转型浪潮,然而,由于数字病理切片分辨率高、涉及病种多,在“大数据+精标注”的传统AI模型训练范式下,想要对每一种疾病进行精标注训练几乎是“不可能完成的任务”。
实际上,国内曾经有多家AI企业想要挑战这一难题,但在经过了多次的调研和分析之后,这些挑战者基本上都选择了放弃。
为了解决这一全球性难题,商汤联合了国内多家顶尖医疗机构和大学研究机构,包括中华医学会病理学分会王哲副主委团队、清华大学何永红教授团队,共同开始了基于AI的大模型病理诊断技术研发工作。
传统的医疗大模型的开发流程,需要投入大量的人力进行医疗数据分类、标记、整理等工作,而模型训练过程中所需算力也是个很大的难题。但对于商汤而言,可以通过日日新大模型的能力,去替代人工进行数据整理和全自动标记;然后通过AI大装置的灵活配置,解决模型训练所需的算力资源,相较传统开发方式,成本更低、速度更快。
功夫不负有心人,在2024世界人工智能大会(WAIC)期间,商汤医疗携手瑞金医院、华西医院、新华医院、西京医院、中科大附属第一医院、北京清华长庚医院,共同推出了国内首个病理大模型PathOrchestra,而这也成为目前阶段,全球赋能临床任务最广的病理大模型。
此次发布的病理大模型PathOrchestra,是商汤与多家专业医疗机构携手,利用国内规模最大的近30万张全切片数字病理图像(近300TB数据)数据集训练,并融合了文本、视频等多模态训练数据,通过对海量数据的自监督学习,让模型“触类旁通”学会了分析各类器官病理图像,目前已覆盖肺、乳腺、肝脏、食管等20余种器官。
在商汤先进AI大模型+大装置的联合加持下,PathOrchestra目前已经可以赋能包括泛癌分类、病灶识别和检测、多癌种亚型分类、生物标志物评估等在内的百余项临床任务,并在多器官泛癌分类、淋巴瘤亚型诊断、膀胱癌筛查等近50项任务中,准确率超过95%。
很多病患,都将从这项开创性工作当中受益。而商汤基于大模型驱动的数智化病理科整体解决方案,也给公司在医疗领域带来了源源不断的订单和回报。
案例二:WPS Copilot Pro
作为国内最资深的办公软件公司,金山的WPS是很多企业办公场景中最常使用的软件。今年4月,金山办公正式推出了WPS 365,携手商汤把基于日日新大模型的办公应用推到了一个新的高度。
对于现代办公软件而言,针对数据的分析、挖掘、整理、可视化输出是一项发生频率很高的工作。经过多年的发展,现代办公软件通常内置了强大的数据分析和报表生成模块。但这些功能的使用和连接通常极为复杂,需要专业的开发人员参与,一般的业务管理人员,如果缺乏专业的代码开发能力,很难把复杂的API加以妥善运用。
有鉴于此,为了进一步提升WPS办公软件的生产效率,降低客户的工作负担,金山办公携手商汤日日新大模型,推出了WPS 365。与个人版不同,WPS 365聚焦为客户打造企业大脑,它分为AI Hub(智能基座)、AI Docs(智能文档库)、Copilot Pro(企业智慧助理)三个组成部分。
其中,AI Hub集成了多种大模型的核心能力,并提供了统一的调用接口;AI Docs则将传统云文档库一键升级为智能文档库,让智能创作来源有依据,完整的文档权限体系保障信息不越权。
至于最重要的Copilot Pro(企业智慧助理),它的核心功能,是帮助运营人员使用自然语言驱动BI产品进行数据的分析和处理。利用商汤日日新大模型和WPS 365深度融合的 Copilot 能将自然语言转换为超强生产力,Copilot Pro将用户的需求转化为可执行的Python 代码,并调用WPS 365 API和企业私有API,自动化的完成相应的数据分析和处理工作,再以可视化的方式反馈给使用者。
基于商汤“日日新”延伸出的代码模型能力打造的WPS大盘数据分析应用,通过对话就能完成数据理解与分析任务
例如,企业高级管理人员想要了解并分析本公司不同工厂员工的出勤情况,只需创建一个智能助手,并接入相应的人力资源API,之后,使用者只需要以自然语言的形式提出分析需求,智能助手就能自动获取不同工厂的出勤数据,进行综合分析,并呈现最终的分析结果。整个过程无需技术人员参与,更不需要繁琐的代码开发和维护。
事实上,在过去一年国产大模型如火如荼的探索中,代码生成能力往往被视作衡量大模型智慧的关键维度。代码生成需要高度的抽象思维和逻辑推理能力,并且要求准确的遵循代码语言的各项规范。目前在国内的各家大模型当中,商汤日日新大模型的代码生成能力最早超越GPT-4,在数据分析、数理计算、逻辑推理等细分领域拥有显著优势。
04 属于AIGC的星辰大海
生成式AI下一步的爆发式增长点在哪里?究竟是基础设施、应用还是开发平台?暂时还没有人知道确切答案。
在大洋彼岸,以英伟达为代表的芯片厂商,已经在这一波浪潮当中吃到了增长红利;而国内的一众厂商,也在基于自身不同的资源禀赋和优势业务,力求抓住这扑面而来的发展机遇。
而在国内所有的生成式AI技术服务商当中,商汤可以算是最具代表性的一个。
其他公司,有的专注于AIDC相关业务,搞AI算力出租的生意,但本质上其实还是传统IDC的重新包装;有的做纯粹的大模型开发商,把所有资源和精力都用于规模更大、成本更高的大模型的开发和迭代,但是在商业化上还处于非常早期的阶段。
而用“两条腿走路”的商汤,在这个市场上显示出了足够独特的竞争优势。
一方面,与AIDC服务商相比,商汤能够提供丰富得多的产品和服务支持,让客户不需要一切从零开始打造大模型相关的基础设施,而是能够借助商汤成熟的大模型生产环境,专注于核心业务逻辑,而不需要为相关的支持和算法框架操心;
另一方面,与大模型开发商相比,商汤能够为企业客户提供更多、更贴近业务需求的选择,无论是完全依赖于商汤日日新大模型的能力调用,还是那些目标更宏大、希望训练自己私有模型的传统商业巨头,商汤都能够提供全栈式的解决方案,满足客户多层次、多阶段的需求。
如果说过去二十年,移动互联网渗透并影响到了千千万万个行业的话,那么未来,将会是AI技术再次重塑和改造商业世界的时代。其中蕴含的机会,数以万计。
无论AI技术下一步的发展方向往何处去,对于一家专注于长期主义的技术驱动型企业而言,坚守自己在产业链中的位置,为客户创造价值,为行业带来进步,在确保长期生存并发展的前提下,为公司夯实和扩大商业版图,这便是正确的发展之道。